Nature文献 | 前额叶功能总是难以捉摸?神经元的混合选择性与高维神经表征
本文介绍的是一篇2013年发表在Nature上的经典论文,这篇论文论证了前额叶的神经表征是高维的,从而解释了前额叶在复杂认知任务中的混合选择性。
大脑的高级皮层(如前额叶,PFC)对外界刺激通常有着非常复杂和多样性的反应模式。比如在较复杂的威斯康辛卡片任务中,PFC可以表征规则、感觉刺激、运动反应等不同方面(aspect)。具有这些特征的神经元就被称具有混合选择性(mixed selectivity),也就是可以对任务的多个方面进行表征。相比之下,只能对任务的单一方面进行表征的神经元就被称为具有单一选择性(pure selectivity)。
为了理解混合选择性的功能作用和统计性特征,本研究分析了猴子在进行序列记忆任务时PFC的神经活动。受到机器学习原理的启发,这里提出了一种新的分析方法,将混合选择性理解成分类器(如支持向量机)信息编码策略的一种特征。
神经表征的维度(dimensionality)的确切定义比较复杂(详见原论文补充材料),这里较简单的解释下。假设在一个实验中有c个实验条件(比如在2*3*4的实验设计中,c=24),我们在每个实验条件下都记录了N个神经元的活动,于是,在一个特定的时间段内,我们可以用N个神经元的活动来表征某个实验条件ci。换句话说,对于任意一个实验条件ci,我们可以认为它是N维空间中的一个点(或者说是一个向量)。对于这样的一组向量c(这里是24),神经表征的维度指的是能够确定所有这些点位置所需要最小坐标轴数目(见下图)。
高维神经表征具有允许简单读取(如线性分类器)实现大量输入输出关系的理想特性。拥有高维神经表征的神经环路也因此可以产生极其丰富的神经动态并解决复杂的任务。
在N个神经元组成的N维空间中,最上面的实验条件c=2,只需要一条直线即可确定这两个点,即维度=1;中间和下面的实验条件c=4,所以需要一个三维空间才能将其确定,即维度=3。对于足够大的N而言,维度d是受到实验条件c约束的,当所有N编码相同的任务相关信息时,由于向量组c之间高度相关,因此维度会较小。
神经表征的维度和神经反应的混合选择性有关。这是因为一组只对单个任务相关信息(甚至是多个方面的线性组合,即线性混合选择性)起反应的神经元只能产生一维的神经表征,而高维表征能够拥有一维信息解释不了的非线性混合选择性(如下图)。
图1 (a) 神经元响应的等值线图。Neuron1代表只对a特征具有选择性的神经元(竖线是等值线);Neuron2 代表只对b特征具有选择性的神经元(横线是等值线);Neuron3 代表对a和b特征具有线性混合选择性的神经元(斜线是等值线);Neuron4 对a和b特征具有非线性混合选择性的神经元(圆圈是等值线)。(b) 具有单一选择性或线性混合选择性的神经元在空间中的活动模式是在一条直线上的,只跨越一个低维空间(图中以三个神经元为例)。(c)具有非线性混合选择性的神经元组合在空间中的活动模式是在平面上而非局限在直线上(图中以三个神经元为例)。换句话说,b图中无法画出一条直线将黑点和绿点区分开,但在c图中,由于黑点和绿点不在一条直线上,则可以利用平面将其分开。
如图2所示,在本实验中,两只猴子被训练来按顺序记住两个呈现物体的identity,然后在第二个延迟(two-object delay)过后进行记忆测试。于此同时,实验者记录了猴子PFC(BA 46区)的237个神经元活动。
在这个任务中,每个trial都有一个由三种相关方面(relevant aspect)定义的条件:即第一个物体的identity(cue1 identity;是四个预设物体之一)、第二个物体的identity(cue2 identity;剩下的三个预设物体之一)和任务规则(再认/回忆)。所以,本研究实验条件共有4*3*2=24种。
图2 (a) 示例顺序。(b)再认任务:猴子被要求判断出现的测试顺序是否和刚刚的示例顺序一样。(c)回忆任务:猴子被要求按照正确的顺序对两个样本物体进行扫视
单细胞反应的结果表明,大部分神经元对三种任务相关方面中的至少一种具有选择性,且很大比例的神经元表现出非线性混合选择性。图3a~图3d展示了两个非线性混合选择性神经元的例子。其中图3a和3b展示了一个对cue1 identity和任务规则反应的神经元(即,对物体C和再认任务敏感);图3c和3d展示了一个对cue2 identity和任务规则反应的神经元(即,对跟在物体C后面的物体A、D和回忆任务敏感)。
图3a~d 具有非线性混合选择性的神经元例子。(a)和(b)反映的神经元对cue1时的C物体敏感、且对再认任务更敏感。(c)和(d)反映的神经元对cue2时先前刺激为C的物体A/D敏感,且对回忆任务更敏感。T1/T2分别代表再认和回忆任务;A/B/C/D代表四个刺激物体。
如果非线性混合选择性足够多样化,我们就可以通过不同条件下的神经反应模式来直接解码任务相关信息。比如要解码任务类型的信息,即使不直接比较回忆任务vs再认任务的神经活动,也可以从不同条件中神经活动的共变模式中得到。也就是说,即使没有存在于单个细胞中,信息也可以分布存储于整个神经集群中,从而被解读出来。
为了验证这个观点,作者在数据中剔除了传统意义上的选择性的信息(通过添加噪声来均衡平均反应,保留单个条件间的差异),来看剔除之后的神经活动能否依然可以解码任务类型等信息(图3e~图3g)。结果发现,在去除经典的选择性前,对任务类型、cue1、cue2最大的多重验证解码正确率都可以接近100%。更重要的是,即使剔除了传统意义的选择性信息,所有的任务相关方面(任务类型/cue1/cue2)依然可以被成功解码。这说明,任务相关信息可以分布于整个神经集群的活动模式中。
图3e~g 剔除经典选择性成分前后(虚线:剔除前;实线:剔除后,两条线是两种剔除方法)对三个任务方面的解码正确率。可以看到,即使剔除了经典选择性成分,所有方面依然可以被成功解码(尽管正确率一开始在概率水平,但逐渐会显著提高)。
作者认为PFC神经元的非线性混合选择性来自于高维神经表征,因此这里论述了神经表征是高维的证据。由于神经表征的维度d受到实验条件数c的约束,这里采用了一种新的策略,利用维数和线性分类器性能之间的关系来提供证据。
维度d和线性分类器的性能有关,可实现的二值分类的数量随着神经表征的维度数的增加而呈指数增长,所以可以通过计算线性分类器可以实现的二值分类数量来估计神经表征的维数。由于本研究的c=24,因此可能的二元分类最大值是2^24。在所有这些可能的分类中,研究者利用交叉验证估计出有多少分类器能被记录到的神经活动模式所实现,将可实现的二值分类总数记为Nc,当输入的数量够大时,相应的维数d=log2Nc。
结果如下图,图4a和4b分别展示了在one-object delay和two-object delay阶段,Nc、维度数量d作为神经元N的函数。结果发现,在这两个阶段,实际数据得到的Nc的渐近线都远大于单一选择性时应有的Nc,Nc和维度都接近于相应的最大值(Nc接近2^c;d接近c)。这一结果表明,在PFC记录到的神经表征是高维的。
图4 神经表征是高维的。每张图的左纵坐标为Nc,右纵坐标为维度数量d。左图是在one-object delay阶段计算的结果,此时实际data的Nc达到了最大维度d=c=8时值(Nc=2de 24次方);右图是在two-object delay阶段计算的结果,此时实际data的Nc数量符合最大维度d=c=24。结果表明,比起单维的模式(灰色线条,对应的d<8),实际data的模式更可能是高维的。
神经表征的维度对于神经环路的动态和最后的行为产生非常重要,因此这里考察了猴子在回忆任务中的错误率和神经表征维度的关系。
图5a展示了正确(黑色)和错误(灰色)试次中Nc和维度数量的关系,结果显示,在错误试次中,神经表征的维度低于正确试次中。不过,两个cue在正确和错误试次中都可以被成功解码(图5b),这表明在错误试次中,cue identity的编码强度和正确试次是一样的。
因此,错误试次中观察到的神经表征维度下降不是因为编码或记忆感官刺激的失败。研究者认为,非线性混合选择性对正确反应很重要,在错误试次中,这种选择性被破坏可能导致了神经表征维度的崩塌,从而损害了行为表现。结果表明正是如此,在量化并减去了混合选择性的线性成分后,正确和错误试次间的维度差异依然显著(图5c),但减去混合选择性的非线性成分后,正确和错误试次间的维度差异就不复存在了(图5d)。
图5 神经表征维度可以预测行为表现
总结而言,本研究发现了PFC区域神经元的混合选择性可以被其高维神经表征所解释,这种高维表征可能是PFC具有极强适应和灵活性编码的原因。神经表征的维度和行为结果有关,在错误试次中,神经表征的维度大幅减少,这表明非线性的混合选择性对于产生正确的行为表现具有重要意义。
原文文献:Rigotti, M., Barak, O., Warden, M. R., Wang, X. J., Daw, N. D., Miller, E. K., & Fusi, S. (2013). The importance of mixed selectivity in complex cognitive tasks. Nature, 497(7451), 585-590. doi:10.1038/nature12160